智能论文笔记

Domain Adaptation from Scratch

Eyal Ben-David , Yftah Ziser , Roi Reichart

分类：自然语言处理 | 人工智能 | 机器学习

2022-09-02

自然语言处理（NLP）算法正在迅速改善，但在应用于分布的示例时通常会挣扎。减轻域间隙的突出方法是域的适应性，其中在源域上训练的模型适应了新的目标域。我们提出了一种新的学习设置，``从头开始适应域名''，我们认为这对于以隐私的方式将NLP的覆盖范围扩展到敏感域至关重要。在此设置中，我们旨在有效地从一组源域中注释数据，以便训练有素的模型在敏感的目标域上表现良好，从而从中无法从中获得注释。我们的研究将这种具有挑战性的设置的几种方法比较，从数据选择和域适应算法到主动学习范式，在两个NLP任务上：情感分析和命名实体识别。我们的结果表明，使用上述方法可以缓解域间隙，并将其组合进一步改善结果。

translated by 谷歌翻译

HTML版本